智能论文笔记

Energy-Aware Multi-Robot Task Allocation in Persistent Tasks

Ehsan Latif , Yikang Gui , Aiman Munir , Ramviyas Parasuraman

分类：机器人

2021-12-31

群机器人执行觅食任务的适用性受其紧凑的尺寸和成本的启发。需要相当大量的能量来执行这些任务，特别是如果任务是连续和/或重复的。现实世界的情况，其中机器人在保持活力（生存能力）时连续执行任务，并最大限度地提高生产（性能）需要能量意识。本文提出了一种能够有意识的分布式任务分配算法来解决连续任务（例如，无限觅食），用于合作机器人以实现高效的任务。当食物返回收集箱时，我们将效率视为机器人在勘探和收集期间消耗的能量的函数。最后，所提出的节能算法最小化了充电站的总传输时间和在充电时消耗的时间消耗，最大化机器人的寿命，以执行最大的任务，以提高协作机器人的整体效率。我们对典型的贪婪基准战略（将最近的收藏箱分配给可用机器人的最近的收集箱并最大充电）效率和性能在各种方案中的效率和性能。拟议的方法显着提高了基线方法的性能和效率。

translated by 谷歌翻译

Analysis of Exploration vs. Exploitation in Adaptive Information Sampling

Aiman Munir , Ramviyas Parasuraman

分类：机器人

2021-11-22

自适应信息采样方法能够有效选择移动机器人的航点，可以获得可以获得物理过程的精确感测和映射，例如辐射或场强。本文分析了勘探和利用在环境过程的这种信息化空间采样中的作用。我们使用高斯过程来预测和估计利用置信度的预测，从而在勘探和剥削方面确定每个点的信息。具体地，我们使用高斯过程回归模型来对环境的Wi-Fi信号强度进行采样。对于信息功能的不同变体，我们广泛地分析和评估了通过单个机器人和多机器人设置中的两个不同初始轨迹的信息映射的有效性和效率。结果在基于采样目标选择适当的信息功能方面提供了有意义的见解。

translated by 谷歌翻译

Deep Reinforcement Learning for Trajectory Path Planning and Distributed Inference in Resource-Constrained UAV Swarms

Marwan Dhuheir , Emna Baccour , Aiman Erbad , Sinan Sabeeh Al-Obaidi , Mounir Hamdi

分类：机器学习 | 机器人

2022-12-21

The deployment flexibility and maneuverability of Unmanned Aerial Vehicles (UAVs) increased their adoption in various applications, such as wildfire tracking, border monitoring, etc. In many critical applications, UAVs capture images and other sensory data and then send the captured data to remote servers for inference and data processing tasks. However, this approach is not always practical in real-time applications due to the connection instability, limited bandwidth, and end-to-end latency. One promising solution is to divide the inference requests into multiple parts (layers or segments), with each part being executed in a different UAV based on the available resources. Furthermore, some applications require the UAVs to traverse certain areas and capture incidents; thus, planning their paths becomes critical particularly, to reduce the latency of making the collaborative inference process. Specifically, planning the UAVs trajectory can reduce the data transmission latency by communicating with devices in the same proximity while mitigating the transmission interference. This work aims to design a model for distributed collaborative inference requests and path planning in a UAV swarm while respecting the resource constraints due to the computational load and memory usage of the inference requests. The model is formulated as an optimization problem and aims to minimize latency. The formulated problem is NP-hard so finding the optimal solution is quite complex; thus, this paper introduces a real-time and dynamic solution for online applications using deep reinforcement learning. We conduct extensive simulations and compare our results to the-state-of-the-art studies demonstrating that our model outperforms the competing models.

translated by 谷歌翻译

Optimization of FPGA-based CNN Accelerators Using Metaheuristics

Sadiq M. Sait , Aiman El-Maleh , Mohammad Altakrouri , Ahmad Shawahna

分类：神经与进化计算 | 计算机视觉

2022-09-22

近年来，卷积神经网络（CNN）证明了它们在许多领域解决问题的能力，并且以前无法进行准确性。但是，这带有广泛的计算要求，这使得普通CPU无法提供所需的实时性能。同时，FPGA对加速CNN推断的兴趣激增。这是由于他们有能力创建具有不同级别的并行性的自定义设计。此外，与GPU相比，FPGA提供每瓦的性能更好。基于FPGA的CNN加速器的当前趋势是实现多个卷积层处理器（CLP），每个处理器都针对一层层量身定制。但是，CNN体系结构的日益增长的复杂性使得优化目标FPGA设备上可用的资源，以使最佳性能更具挑战性。在本文中，我们提出了CNN加速器和随附的自动设计方法，该方法采用元启发式学来分区可用的FPGA资源来设计多CLP加速器。具体而言，提出的设计工具采用模拟退火（SA）和禁忌搜索（TS）算法来查找所需的CLP数量及其各自的配置，以在给定的目标FPGA设备上实现最佳性能。在这里，重点是关键规格和硬件资源，包括数字信号处理器，阻止RAM和芯片内存储器带宽。提出了使用四个众所周知的基准CNN的实验结果和比较，表明所提出的加速框架既令人鼓舞又有前途。基于SA-/TS的多CLP比在加速Alexnet，Squeezenet 1.1，VGGNET和Googlenet架构上的最新单个/多CLP方法高1.31x-2.37倍高2.37倍。和VC709 FPGA板。

translated by 谷歌翻译

Towards Improving Calibration in Object Detection Under Domain Shift

Muhammad Akhtar Munir , Muhammad Haris Khan , M. Saquib Sarfraz , Mohsen Ali

分类：计算机视觉

2022-09-15

在安全至关重要的应用中，深度神经网络的使用越来越多，就需要训练有素的模型。当前大多数校准技术解决了分类问题，同时着重于改善对内域预测的校准。在许多决策系统中占据相似的空间和重要性的视觉对象探测器的校准几乎没有关注。在本文中，我们研究了当前对象检测模型的校准，尤其是在域移位下。为此，我们首先引入了插件的火车时间校准损失以进行对象检测。它可以用作辅助损失函数，以改善检测器的校准。其次，我们设计了一种新的不确定性量化机制来进行对象检测，该机制可以隐式校准常用的基于自我训练的域自适应检测器。我们在研究中包括单阶段和两阶段对象探测器。我们证明，我们的损失改善了具有明显边缘的内域和室外检测的校准。最后，我们展示了我们技术在校准不同域移动方案中的域自适应对象探测器方面的实用性。

translated by 谷歌翻译

RL-DistPrivacy: Privacy-Aware Distributed Deep Inference for low latency IoT systems

Emna Baccour , Aiman Erbad , Amr Mohamed , Mounir Hamdi , Mohsen Guizani

分类：机器学习 | 人工智能

2022-08-27

尽管深度神经网络（DNN）已成为多个无处不在的应用程序的骨干技术，但它们在资源受限的机器中的部署，例如物联网（IoT）设备，仍然具有挑战性。为了满足这种范式的资源要求，引入了与IoT协同作用的深入推断。但是，DNN网络的分布遭受严重的数据泄漏。已经提出了各种威胁，包括黑盒攻击，恶意参与者可以恢复送入其设备的任意输入。尽管许多对策旨在实现隐私的DNN，但其中大多数会导致额外的计算和较低的准确性。在本文中，我们提出了一种方法，该方法通过重新考虑分配策略而无需牺牲模型性能来针对协作深度推断的安全性。特别是，我们检查了使该模型容易受到黑盒威胁的不同DNN分区，并得出了应分配每个设备的数据量以隐藏原始输入的所有权。我们将这种方法制定为一种优化，在该方法中，我们在共同推导的延迟与数据级别的数据级别之间建立了权衡。接下来，为了放大最佳解决方案，我们将方法塑造为支持异质设备以及多个DNN/数据集的增强学习（RL）设计。

translated by 谷歌翻译

HTML版本

ViT-ReT: Vision and Recurrent Transformer Neural Networks for Human Activity Recognition in Videos

James Wensel , Hayat Ullah , Arslan Munir , Erik Blasch

分类：计算机视觉

2022-08-16

人类活动识别是计算机视觉中的新出现和重要领域，旨在确定个体或个体正在执行的活动。该领域的应用包括从体育中生成重点视频到智能监视和手势识别。大多数活动识别系统依赖于卷积神经网络（CNN）的组合来从数据和复发性神经网络（RNN）中进行特征提取来确定数据的时间依赖性。本文提出并设计了两个用于人类活动识别的变压器神经网络：一个经常性变压器（RET），这是一个专门的神经网络，用于对数据序列进行预测，以及视觉变压器（VIT），一种用于提取显着的变压器的变压器（VIT）图像的特征，以提高活动识别的速度和可扩展性。我们在速度和准确性方面提供了对拟议的变压器神经网络与现代CNN和基于RNN的人类活动识别模型的广泛比较。

translated by 谷歌翻译

Unifying local and global model explanations by functional decomposition of low dimensional structures

Munir Hiabu , Joseph T. Meyer , Marvin N. Wright

分类：机器学习 | (统计)机器学习

2022-08-12

我们通过将回归或分类函数的全局解释分解为主组件和任意顺序的相互作用组件的总和。当添加由因果解释激励的识别约束时，我们发现Q交互作用是该约束的独特解决方案。在这里，Q表示分解中存在的最高相互作用。我们的结果为具有各种实践和理论含义的外形值提供了新的视角：如果将塑形值分解为主要和所有相互作用效应，它们提供了带有因果解释的全球解释。原则上，分解可以应用于任何机器学习模型。但是，由于可能的相互作用的数量随特征的数量呈指数增长，因此精确的计算仅对于适合低维结构或这些组合的方法可行。我们为梯度增压树提供了一种算法和有效的实施（Xgboost和随机种植的森林，计算出这种分解。进行的实验表明，我们的方法提供了有意义的解释，并揭示了更高阶的相互作用。我们还通过利用新见解的进一步的潜力来利用新见解的进一步的潜力。全球解释，用于激励特征重要性的新量度，以及通过删除事后删除来减少直接和间接偏见。

translated by 谷歌翻译

Human Activity Recognition Using Cascaded Dual Attention CNN and Bi-Directional GRU Framework

Hayat Ullah , Arslan Munir

分类：计算机视觉 | 人工智能

2022-08-09

基于视觉的人类活动识别已成为视频分析领域的重要研究领域之一。在过去的十年中，已经引入了许多先进的深度学习算法，以识别视频流中复杂的人类行为。这些深度学习算法对人类活动识别任务显示出令人印象深刻的表现。但是，这些新引入的方法仅专注于模型性能或这些模型在计算效率和鲁棒性方面的有效性，从而导致其解决挑战性人类活动识别问题的提议中的偏差折衷。为了克服当代深度学习模型对人类活动识别的局限性，本文提出了一个计算高效但通用的空间级联框架，该框架利用了深层歧视性的空间和时间特征，以识别人类活动的识别。为了有效地表示人类行动，我们提出了有效的双重注意卷积神经网络（CNN）体系结构，该结构利用统一的通道空间注意机制来提取视频框架中以人为中心的显着特征。双通道空间注意力层与卷积层一起学会在具有特征图数量的物体的空间接收场中更加专注。然后将提取的判别显着特征转发到堆叠的双向封闭式复发单元（BI-GRU），以使用前进和后传球梯度学习，以实现长期时间建模和对人类行为的识别。进行了广泛的实验，其中获得的结果表明，与大多数当代动作识别方法相比，所提出的框架的执行时间的改善最高167倍。

translated by 谷歌翻译

Breast Cancer Classification using Deep Learned Features Boosted with Handcrafted Features

Unaiza Sajid , Dr. Rizwan Ahmed Khan , Dr. Shahid Munir Shah , Dr. Sheeraz Arif

分类：计算机视觉 | 机器学习

2022-06-26

乳腺癌是全球女性死亡的主要原因之一。如果在高级阶段检测到很难治疗，但是，早期发现可以显着增加生存机会，并改善数百万妇女的生活。鉴于乳腺癌的普遍流行，研究界提出早期检测，分类和诊断的框架至关重要。与医生协调的人工智能研究社区正在开发此类框架以自动化检测任务。随着研究活动的激增，加上大型数据集的可用性和增强的计算能力，预计AI框架结果将有助于更多的临床医生做出正确的预测。在本文中，提出了使用乳房X线照片对乳腺癌进行分类的新框架。所提出的框架结合了从新颖的卷积神经网络（CNN）功能中提取的强大特征，以及手工制作的功能，包括猪（定向梯度的直方图）和LBP（本地二进制图案）。在CBIS-DDSM数据集上获得的结果超过了技术状态。

translated by 谷歌翻译